@秒灵儿
2年前 提问
1个回答
数据脱敏包括哪些过程
Simon
2年前
数据脱敏包括以下这些过程:
元数据识别过程:数据脱敏平台将脱敏文本读入,脱敏平台可设置读入数据的行数,默认文件头为格式(txt/csv/xml/python文本),用户可自行设置间隔符号;同时若文本文件中默认不包含元数据头文件,用户可自行设置元数据名称与格式。
脱敏数据识别过程:经过元数据识别/设置后,文本脱敏的敏感数据识别与数据库敏感数据识别是相同的,均按照元数据描述及抽样数据本身特点,使用系统的敏感数据扫描可识别出疑似敏感数据。
定义脱敏方案过程:在疑似敏感数据基础上,用户根据实际需求对需要脱敏的数据、脱敏规则进行设置,形成文本文件的脱敏方案。
脱敏执行过程:设置脱敏后数据的目标(需支持到文件、到库),脱敏执行过程将数据抽取、处理、装载一次性完成。
脱敏后对比过程:脱敏后数据用户需在界面可见脱敏前后对比,对比的内容包括:脱敏前数据条数、脱敏后数据条数等。
数据脱敏方法有以下这些:
仿真:是根据敏感数据的原始内容生成符合原始数据编码和校验规则的新数据,使用相同含义的数据替换原有的敏感数据,例如姓名脱敏后仍然为有意义的姓名,住址脱敏后仍然为住址。仿真算法能够保证脱敏后数据的业务属性和关联关系,从而具备较好的可用性。
数据替换:用某种规律字符对敏感内容进行替换,从而破坏数据的可读性,并不保留原有语义和格式,例如特殊字符、随机字符、固定值字符等。
加密:通过加密算法(包括国密算法)进行加密。例如Hash(密码算法)算法是指对于完整的数据进行Hash加密,使数据不可读。
数据截取:数据截取术是指对原始数据选取部分内容进行截断。
数据混淆:混淆算法是将敏感数据的内容进行无规则打乱,从而在隐藏敏感数据的同时能够保持原始数据的组成方式。